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Celem artykułu jest opis diagnozowania w praktyce psychologicznej. Artykuł skupia się na dwóch 
istotnych problemach diagnozowania opartego na dowodach empirycznych. Pierwszy z nich to 
zastosowanie EMB w psychologii. Drugi to opis działań i osiągnięć Buros Institute of Mental Me- 
asurements. Poddano też dyskusji implikacje dla przyszłości diagnozowania w polskiej praktyce 
psychologicznej. 


Słowa kluczowe: diagnoza oparta na dowodach empirycznych — czy potrzebny jest „polski Buros”? 
diagnozowanie, EBA, EBM. 


Podczas XXXIII Zjazdu Naukowego Polskiego Towarzystwa Psychologicz- 
nego miałem zaszczyt organizować i uczestniczyć w dyskusji panelowej na te- 
mat „Testy psychologiczne w świetle prawa”'. Dla mnie najważniejsze były 
następujące wątki naszej dyskusji: 

(1) niska kultura prawna, mająca swe źródło głównie w braku wiedzy (też — 
na studiach), powodująca naruszanie (głównie) majątkowych praw autorskich; 
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Sp. z 0.0.) oraz Tatiana Szostok (ALTA Sp. z o.o.). Wszystkim Im dziękuję za krytyczne uwagi 
dotyczące pierwszej wersji tego artykułu. 


8 WŁADYSŁAW JACEK PALUCHOWSKI 


(2) niski poziom standardów zawodowych użytkowników testów (psycholo- 
gów), a także niski poziom oczekiwań co do standardów, jakie mają spełniać 
narzędzia psychologiczne; 

(3) oraz — jako konsekwencja tej diagnozy stanu testowania — a) konieczność 
powołania instytucji zajmującej się propagowaniem standardów używania testów 
i formułującej ogólne zalecenia w tym zakresie; b) konieczność powołania in- 
stytucji zbierającej informacje o konkretnych testach rynkowych i wydającej 
o nich niezależne opinie oraz je upowszechniającej; c) wspieranie powstawania 
większej liczby prac akademickich (w tym magisterskich) na temat testów 
komercyjnych. 

Problemy poruszane podczas tej dyskusji dotyczyły głównie niskiej jakości 
naukowej bazy praktyki testowania oraz etycznych i prawnych aspektów tej 
praktyki. Niniejszy artykuł jest podsumowaniem pierwszego wątku tej dyskusji. 

Powszechne jest błędne przekonanie, że tylko w fazie przygotowywania te- 
stu i jego komercjalizacji ważna jest poprawność metodologiczna procedur i — co 
za tym idzie — że po opublikowaniu test psychologiczny jest skończonym pro- 
duktem (narzędziem). Jednak równie ważne jest to, co dzieje się po opublikowa- 
niu narzędzia — ustawiczna aktualizacja norm oraz badania naukowe nad obsza- 
rami jego trafności”. O wartości testu psychologicznego decyduje więc zarówno 
przestrzeganie standardów psychologicznych podczas jego tworzenia oraz pod- 
czas korzystania z niego w praktyce, jak i liczba prac naukowych, których jest on 
przedmiotem. Problem oparcia diagnozowania na dowodach naukowych oraz 
swoistej kontroli rynku komercyjnych narzędzi diagnostycznych jest ważny 
z jednej strony dlatego, że coraz silniejszy jest nacisk na analizowanie wiarygod- 
ności diagnostycznych narzędzi psychologicznych, oraz dlatego, że — z drugiej 
strony — niewiedza potencjalnych klientów sprzyja swoistej „tabloidyzacji” 
testów. Wzorcowe może być przedsięwzięcie Oskara K. Burosa — utworzenia 
organizacji zajmującej się zarówno inicjowaniem badań naukowych dotyczących 
testów, jak i krytyczną refleksją nad istniejącym instrumentarium diagnostycz- 
nym psychologów praktyków. 


> Na przykład czy test sprawdzony „w klinice” ma sens podczas selekcji (co jest w polskiej 
praktyce błędem nagminnym). 
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OD TEGO SIĘ ZACZĘŁO 
— MEDYCYNA OPARTA NA DOWODACH EMPIRYCZNYCH 


Rola badań naukowych nad procesem diagnozowania i stosowanych w nim 
narzędzi rośnie w ciągu ostatnich lat. Jest to z jednej strony spowodowane środo- 
wiskowym naciskiem na to, by decyzje dotyczące ludzi oparte były na najlepszej 
i najnowszej wiedzy naukowej (dowodach, przesłankach), oraz — z drugiej — na- 
cisku instytucji dysponujących publicznymi pieniędzmi, by racjonalnie wykorzy- 
stać ograniczone środki przeznaczane na służbę zdrowia i wydawać je tylko na te 
procedury, których trafności i skuteczności dowiedziono naukowo”. W efekcie 
nie wystarcza już wiedza zdobyta w czasie studiów, ale konieczne jest ciągłe jej 
wzbogacanie przez całe życie zawodowe. 

Ruch EBM wychodzi poza to, co można nazwać medycyną naukową, i kła- 
dzie nacisk na sposób gromadzenia naukowych danych użytecznych klinicznie 
(praktycznie). Jest on nie tylko walką z medycyną intuicyjno-kazuistyczną, 
opartą na przesądach i niezweryfikowanych empirycznie metodach, ale także 
przeciwwagą dla medycyny akademickiej, nastawionej na badania podstawowe. 
Ruch ten rozpoczął się w medycynie, bo to tam powstało pojęcie Evidence Based 
Medicine (EBM) — czyli strategii zdobywania wiedzy opartej na poprawnie me- 
todologicznie przeprowadzonych i aktualnych badaniach naukowych” i jedno- 
cześnie potrzebnej w codziennej praktyce do podejmowania decyzji klinicznych 
w zakresie diagnostyki i leczenia. Istotą podejścia EBM jest więc integracja 
wniosków płynących z doniesień naukowych z doświadczeniem klinicznym oraz 
preferencjami pacjentów (Guyatt, 2003; Sackett i in., 1996). Te wnioski stają się 
bazą do wypracowania standardów postępowania, które mają pomagać w podej- 
mowaniu optymalnych decyzji (wytycznych; por. Gajewski i in., 2007; Jaeschke, 
Cook, Guyatt, 1999b, 1999c; Jaeschke i in., 1999a, 1999b; Jaeschke i in., 1999). 

Główny zarys systemu EBM powstał w początkach lat dziewięćdziesiątych 
XX wieku, w zespole naukowców Uniwersytetu McMasters w Ontario, kierowa- 
nym przez Davida L. Sacketta, początkowo jako model teoretyczny. Medycyna 
oparta na faktach została określona jako „dokładne, jasne i rozważne użycie ak- 
tualnie najlepszych danych przy podejmowaniu decyzji terapeutycznych w sto- 


* Najczęściej oznacza to wykorzystywanie badań eksperymentalnych w modelu losowych ba- 
dań kontrolowanych (randomized controlled trials, RCT). Grupa CONSORT (Consolidated Stan- 
dards of Reporting Trials) opracowała wytyczne co do sposobu prezentowania wyników takich 
badań (por. Łuszczyńska, Doliński, 2008). Warto jednak zaznaczyć, że badania realizowane w ta- 
kim modelu dotyczą głównie farmakoterapii i (rzadziej) procedur terapeutycznych (np. zabiegów 
operacyjnych), sporadycznie natomiast procesu czy następstw diagnozy. 

Co nie wyklucza, że dzisiejszy dowód stanie się jutro mitem! 
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sunku do poszczególnych pacjentów, łączące doświadczenia kliniczne z najlep- 
szymi zewnętrznymi danymi klinicznymi, pochodzącymi z systematycznych 
badań” (Sackett i in., 1996). EBM to podejście do rozwiązywania problemów 
klinicznych integrujące (Sackett i in., 1996) wiedzę, umiejętności i doświad- 
czenie kliniczne, dane z badań naukowych oraz wartości pacjenta i jego prefe- 
rencje (w pediatrii często też rodziców lub opiekunów dziecka; Szajewska, 
2008). Dziedziną medycyny, która w największym stopniu przyczyniła się do 
przyjęcia i do rozwoju naukowych metod badawczych, była nowoczesna epide- 
miologia (Sackett i in., 1991). Autorem oryginalnego pojęcia jest profesor medy- 
cyny Gordon Henry Guyatt, pracujący w Zakładzie Epidemiologii Klinicznej 
i Biostatystyki na uniwersytecie McMaster w Hamilton w Kanadzie (Guyatt, Ca- 
irns, Churchill, 1992; Guyatt, 2003). 

W polskiej literaturze nie ma zgody co do tłumaczenia tego angielskiego 
terminu — tłumaczony jest on jako „medycyna faktów”, „medycyna wiarygodna”, 
„medycyna oparta na dowodach empirycznych”, „krytyczna ewaluacja badań 
medycznych” (propozycja Centrum Monitorowania Jakości w Ochronie Zdro- 
wia), „medycyna oparta na dowodach naukowych — MODNa”, „praktyka oparta 
na wiarygodnych i aktualnych publikacjach (POWAP)” (Jaeschke, Cook, Guyatt, 
1998a; Jaeschke i in., 2000). Jednak generalnie w większości publikacji autorzy 
używają skrótu EBM. Kiedy w 2003 roku w Krakowie został powołany Polski 
Instytut EBM, to także pozostano przy skrócie EBM — jak piszą jego twórcy 
(Gajewski, Jaeschke, Mrukowicz, 2003, s. 33): ,,[...] zdecydowaliśmy się nie 
forsować polskiej nazwy i posługiwać się oryginalnym określeniem”. 

Zgodnie z pierwotnymi założeniami termin EBM miał opisywać (i wspoma- 
gać) proces podejmowania decyzji w medycynie praktycznej. Podejście to zmie- 
niało także stosunek do badań naukowych — wymogi ogólnometodologiczne 
dotyczyły wcześniej przede wszystkim prac naukowych, pisanych w celach po- 
znawczych, a nie praktycznych (choć są też głosy sceptyczne wobec innowacyj- 
ności tego podejścia — por. Doroszewski, 2005). Jednym z odrzucanych jest za- 
łożenie, że wiarygodne wnioski kliniczne powinny być oparte na przedklinicz- 
nych badaniach podstawowych (głównie in vitro 1 na zwierzętach), pozwalają- 
cych na zrozumienie anatomicznych, fizjologicznych i patologicznych podstaw 
obserwowanych objawów (Jaeschke, Cook, Guyatt, 1998a). Nie oznacza to oczy- 
wiście, że w EBM ignoruje się wiedzę ogólną (oraz doświadczenie i intuicję); 
jest wręcz przeciwnie — uważa się je za konieczne, choć niewystarczające, jed- 
nak nacisk kładzie się na jasne wyartykułowanie przesłanek wnioskowania doty- 
czącego danego, konkretnego przypadku i zwraca uwagę na to, że wnioski oparte 
na dedukcji z nauk podstawowych mogą być mylne („oświecony sceptycyzm”). 
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Z drugiej strony tylko wiedza ogólna (dotycząca tzw. modeli eksplanacyjnych, 
przyczynowych) pozwala dostrzec i zinterpretować wskaźniki. 

Innym odrzucanym założeniem (Jaeschke, Cook, Guyatt 1998a; por. też 
Jaeschke i in., 2000) jest to, że obserwacje pochodzące z praktyki klinicznej 
(własnej lub innych osób) stanowią wiarygodne i wystarczające źródło praktycz- 
nej wiedzy medycznej. Osobiste doświadczenie i praktyka są przeceniane co do 
ich wartości, zawsze bowiem mają one charakter lokalny, ograniczony do przy- 
padków niereprezentatywnych dla wszystkich pacjentów, ale — kontekstowo — 
dobranych (próba obciążona, stronnicza), a ich ocena zależy od specyficznych 
cech podmiotowych lekarza (rodzaj wykształcenia czy preferencja poznawcza). 
Ponadto bazowanie na doświadczeniu autorytetów częściej ma za podstawę 
wiarę niż mądrość, która zastępowana bywa przez utrwalone stereotypy i modę 
(Sułkowski, 2007). Jednocześnie zwraca się uwagę na to, że — na przykład — 
wyniki postępowania diagnostycznego zależą w dużej mierze od poświadczenia 
diagnosty (Łanda, Walczak, 2005). 

Ruch EBM jest formą realizacji bardziej ogólnego paradygmatu — standa- 
ryzacji procedur i kontroli jakości. Przyjęcie podejścia EBM wymagało także 
ujednolicenia metodyki badań klinicznych (co krytycy nazywają McDonaldyza- 
cją medycyny). We wspomnianym Zakładzie Epidemiologii Klinicznej i Biosta- 
tystyki na uniwersytecie McMaster zaproponowano odpowiednią strukturę pyta- 
nia badawczego o akronimie PICO lub PICO(T) — powinno ono zawierać infor- 
macje o populacji, której ma dotyczyć wynik badań, rodzaju badanej interwencji, 
o grupie kontrolnej (porównawczej) i stosowanych wobec niej oddziaływaniach 
(interwencji alternatywnej) oraz o sposobie mierzenia efektu badanej interwen- 
cji; niekiedy dodatkowo wskazuje się na konieczność podania przedziału czasu, 
w którym obserwowano badane grupy (Sackett i in., 1997; Mrukowicz, 2005). 
Przykładowo (Mrukowicz, 2005), niepoprawne pytanie badawcze brzmi: „Czy 
tamoksyfen jest skuteczny w raku sutka?”; natomiast jego poprawna wersja 
ma postać: „Czy u kobiet w wieku 35-70 lat obciążonych dużym ryzykiem 
zachorowania na raka sutka (P) tamoksyfen stosowany w dawce 20 mg na 24 h 
przez 5 lat (I) zmniejsza w porównaniu z placebo (C) ryzyko wystąpienia raka 
sutka (O)?” 

Punktem wyjścia koncepcji EBM była też konstatacja, że wiedza nabywana 
podczas studiów medycznych często już na studiach jest anachroniczna, a po 
nich szybko się dezaktualizuje — im dalej od studiów, tym większe jest posiadane 
doświadczenie z jednej strony i tym mniej aktualna wiedza medyczna z drugiej 
(Jaeschke, Cook, Guyatt, 1998a). W przeszłości przyjmowano, że wiedza prze- 
kazywana podczas studiów jest wiedzą aktualną nie tylko w momencie jej po- 
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wstawania, ale także wiele lat po studiach. Odrzucenie tego założenia powoduje 
konieczność ciągłego uzupełniania wiedzy (doświadczenia) — zazwyczaj za po- 
mocą takich środków, jak szukanie w podręcznikach medycznych (często z cza- 
sów studiów), zbieranie opinii bardziej doświadczonych współpracowników, 
udział w konferencjach i szkoleniach itp. (tamże). 

Jednak nawet mimo posiadania ogólnej wiedzy metodologicznej, potrzebnej 
do czytania prac naukowych (o czym od lat pisze Brzeziński — 2004), lekarze 
praktycy nie są w stanie ocenić i dokonać całościowej analizy publikowanych 
danych klinicznych, zdobywanych przecież w różnych warunkach, na różnych 
próbach i za pomocą różnych metod (Jaeschke, Cook, Guyatt, 1998a), nawet 
jeśli korzystają oni z artykułów przeglądowych (zawierających metaanalizy; 
Jaeschke, Cook, Guyatt, Bochenek, 1998). Zdaniem zwolenników EBM realiza- 
cja postulatu stałego aktualizowania wiedzy jest możliwa tylko wówczas, gdy 
istnieje możliwość łatwego pozyskania informacji o wynikach badań z baz da- 
nych, zawierających publikacje wyselekcjonowane pod względem znaczenia kli- 
nicznego i wiarygodności. Konieczne jest też kształcenie w zakresie korzystania 
z nich, czyli tzw. umiejętności informacyjnych (Lasoń i in., 2005): posiadania 
wiedzy o źródłach informacji i umiejętność ich wyszukiwania oraz zadawania 
pytań w odpowiedniej formie (por. opis: Jaeschke, Cook, Guyatt, 1998a, s. 7), 
a także umiejętności krytycznej oceny znalezionych informacji, ich interpretacji 
oraz ich porządkowania i syntezy. 

Koncepcja EBM ma swoje konsekwencje także dla kształcenia (EBL — Evi- 
dence Based Learning, EBE — Evidence Based Education, także BEME — Best 
Evidence in Medical Education). Określa się je jako kształcenie skoncentrowane 
na problemach i studencie (problem based study & student oriented study — 
Łanda, Walczak, 2005; Lasoń i in., 2005; Del Mar, Glasziou, Mayer, 2004). Po- 
lega ono na tym, że stawia się studentów przed konkretnym problemem klinicz- 
nym, który wymaga samodzielnego rozwiązania przez wskazanie najlepszego 
w tym przypadku sposobu diagnozowania zakończonego prawidłowym rozpo- 
znaniem oraz najlepszego sposobu leczenia, wyprowadzonym z aktualnego stanu 
wiedzy medycznej. Niezbędnym zapleczem do poszukiwania rozwiązań jest 
dostęp do medycznych baz danych. 
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DIAGNOZA PSYCHOLOGICZNA 
OPARTA NA DOWODACH EMPIRYCZNYCH 


W omawianym obszarze psychologia niewiele się różni od medycyny. I tu, 
w interesie coraz lepiej wyedukowanych klientów, leży posługiwanie się takimi 
psychologicznymi metodami diagnozy i terapii, których skuteczność udoku- 
mentowana jest naukowo. Także dla psychologii ważne jest, by badania były 
zgodne z jakimś ogólnie przyjętym i akceptowanym standardem. Ważne jest to, 
by gromadzone dane oparte na poprawnie metodologicznie przeprowadzonych 
i aktualnych badaniach naukowych miały nie tylko charakter poznawczo-aka- 
demicki, ale by były też użyteczne praktycznie. Również w psychologii bada- 
nia podstawowe trudno przekładają się na praktykę psychologiczną i stanowią 
słabe uzasadnienie stosowanych metod diagnozowania i interwencji. Jednocześ- 
nie wartość naukowa obserwacji własnej lub cudzej praktyki klinicznej także 
i w psychologii są przeceniane co do ich wartości. 

Duch EBM przeniósł się najpierw do badania psychoterapii (EST — Empiri- 
cally Supported Therapies, por. Westen, Nowotny, Thompson-Brenner, 2004), 
potem diagnozy (EBA — Evidence-Based Assessment, por. Hunsley, Mash, 2005; 
Mash, Hunsley, 2005), a następnie ogarnął całość praktyki psychologicznej 
(EBPP — Evidence-Based Practice in Psychology, Levant i in., 2006; Hunsley, 
2007). Recepcja w amerykańskiej psychologii koncepcji EBM jest specyficzna 
i w jakiejś mierze megalomańska: w raporcie grupy zadaniowej APA" (Levant 
i in., 2006) wspomina się o tym, że w psychologii postulat empiryczności ma 
długą historię (datująca się od 1896 roku! — s. 271), co świadczy o dobrym sa- 
mopoczuciu autorów; że zawsze była wrażliwa na różnice indywidualne” (co 
skądinąd jest prawdziwe, ale użyte w tym kontekście sugeruje jakieś specjalne 
w tym względzie zasługi psychologii — s. 274, 278-279); że wśród dowodów 
empirycznych najważniejsze są te, które czerpane są z obserwacji, analizy przy- 
padku oraz badań podstawowych (a uważane za najbardziej poprawne i wiary- 
godnie randomizowane badania kliniczne z podwójnie lub potrójnie ślepą próbą 
znalazły się na miejscu przedostatnim, a na ostatnim metaanalizy — s. 274); że 
zadaniem psychologów praktyków jest przystosowywanie ogólnych prawidło- 


5 W innej pracy Westen, Nowotny, Thompson-Brenner (2005) piszą, że EST jest częścią 
EBPP. 

6 Notabene pisze się tam (s. 273), że diagnozowanie jest formą interwencji, co pozwala stoso- 
wać te same (co w ocenianiu terapii) kryteria. 

7 Z naciskiem na „indywidualne”. Na marginesie warto zaznaczyć, że podnoszenie teoretycz- 
nego zakotwiczenia narzędzi ma wyzwolić psychodiagnostykę z dziedzictwa poszukiwania różnie 
indywidualnych. 
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wości do konkretnej sytuacji (s. 275, 277, 279). Ten ostatni postulat — uwzględ- 
niania indywidualnych właściwości klienta — jest jednak inaczej rozumiany 
w koncepcji EBM. Jak pisze Mrukowicz (2005), owo uwzględnianie indywidu- 
alnych właściwości pacjenta powinno mieć miejsce w czasie badań (zbierania 
dowodów empirycznych), a nie podczas aplikowania wykrytej w badaniach na- 
ukowych prawidłowości ogólnej i uzasadniania odstępowaniem od niej odwo- 
ływaniem się do indywidualizacji. 

W 2005 roku ukazały się dwa monograficzne numery międzynarodowych 
czasopism psychologicznych”, poświęcone diagnozowaniu opartemu na dowo- 
dach empirycznych (EBA). Na czym polega specyfika tego podejścia i co wnosi 
ono nowego do diagnozy psychologicznej (por. też Stemplewska-Żakowicz, 
Paluchowski, 2008)? W propozycji EBA podkreśla się konieczność wykorzy- 
stywania badań i wiedzy do świadomego wyboru celów diagnozowania, metod 
i konkretnych narzędzi i/lub procedur diagnostycznych, a także integrowania 
„twardych” danych naukowych i „miękkich” danych klinicznych. Stosowanie się 
do standardów EBA to nie tylko respektowanie wymogu psychometrycznej do- 
broci stosowanych narzędzi, ale pójście dalej. 

Podkreśla się (Hunsley, Mash, 2005; Kazdin, 2005) przede wszystkim, że nie 
ma wiarygodnej interwencji bez wiarygodnej diagnozy. Diagnozowanie oparte 
na dowodach empirycznych dotyczyć może (powinno) zarówno oceny efektów 
interwencji, jak i tradycyjnie rozumianego diagnozowania, w tym psychome- 
trycznych parametrów stosowanych narzędzi w odniesieniu do konkretnego celu 
ich użycia" oraz dodatkowo klinicznej i diagnostycznej użyteczności procedury 
diagnostycznej, kosztu diagnozy, czułości i specyficzności stosowanych wskaź- 
ników itp. (Hunsley, Mash, 2005; por. też Paluchowski, 2007, s. 53-57, s. 82; 
Stemplewska-Żakowicz, Paluchowski, 2008, s. 50). Towarzystwo Psychologii 
Pediatrycznej (54 Oddział APA) opracowało zestaw kryteriów do oceny narzę- 
dzi diagnostycznych, uzupełniony później przez Diane L. Chambless i Thomasa 
H. Ollendicka (za: Cohen i in., 2008), i obejmujący następujące wysokie wyma- 
gania co do metod diagnozy: narzędzie powinno być opisane w co najmniej 


8 Oba numery monograficzne wydano w 2005 roku, są to: Psychological Assessment (tom 17) 
oraz Journal of Clinical Child and Adolescent Psychology (tom 34). 

? Co widać w zmianie sposobu podejścia w nowych ,,Standardach dla procedur stosowania tes- 
tów w psychologii i edukacji” (AERA, APA, NCME, 2007; Hornowska, 2007). 

Szczególnie trafności kryterialnej diagnostycznej oraz aspektu różnicowego trafności 

i przyrostu (incremental validity) trafności predykcji dla konkretnych sytuacji diagnostycznych. 
Warto to podkreślić — nie mówi się bowiem o cechach psychometrycznych narzędzi „w ogóle”, ale 
wyników (i decyzji na nich opartych) uzyskanych w konkretnej sytuacji (czy ich klasie). 


CZY POTRZEBNY JEST „POLSKI BUROS”? 15 


dwóch recenzowanych czasopismach przez niezależnych badaczy lub zespoły”, 
muszą być dostępne informacje w celu ewentualnego powtórzenia badań oraz 
narzędzie musi mieć wystarczające parametry psychometryczne przynajmniej 
w jednej z tych publikacji”. 

John Hunsley i Eric J. Mash (2005) zwracają uwagę na konieczność — ze 
względu na stosunkowo mało czasu, który można przeznaczać na diagnozowanie 
— wykorzystywania tych narzędzi, które dotyczą rdzeniowych aspektów pro- 
blemu (aspekt użyteczności diagnostycznej), który jest badany (a także takich, 
które są mniej czasochłonne). Mówi się (Hunsley, Mash, 2005), że ogólne bate- 
rie testów powinny ustąpić miejsca testom specyficznych funkcji, co oczywiście 
wymaga bardziej precyzyjnych hipotez co do źródeł i mechanizmu zaburzeń. 
Podkreśla się także konieczność empirycznego dokumentowania sposobu inte- 
growania informacji diagnostycznych oraz ich całościowej interpretacji (Huns- 
ley, Mash, 2005). Zwraca się także (Hunsley, Mash, 2005; Hunsley, 2007) 
uwagę na konieczne zmiany kształcenia psychologów, wynikające z postulatów 
EBA — większy udział takich metod, jak arkusze samoobserwacji objawów spe- 
cyficznych dla zaburzenia, ich monitoringu i ustrukturowanych wywiadów. 

W diagnozowaniu zgodnym z postulatami EBM ważne są też takie charakte- 
rystyki wskaźników diagnostycznych, jak dokładność, wartość predykcji na pod- 
stawie wyników dodatnich (zwana też mocą prognozy pozytywnej), wartość 
predykcji na podstawie wyników ujemnych, krzywe ROC itp. (Jaeschke, Cook, 
Guyatt, 1998b, 1998c). Poszukuje się takich testów wzorcowych (test referen- 
cyjny, tzw. złoty standard), które mogłyby w danym obszarze stanowić kryte- 
rium wiarygodności. Szczegółowe pytania, jakie stawia się w tym obszarze, to 
(Szajewska, 2004; por. też Stemplewska-Żakowicz, Paluchowski, 2008): jakie są 
wskaźniki wiarygodności? (czy test jest użyteczny, tzn. czy ma potencjalne zna- 
czenie dla praktyki klinicznej; czy wyniki testu porównano z jakimś testem refe- 
rencyjnym)? czy wyniki badań będą pomocne w praktyce klinicznej (czy powta- 
rzalność wykonania samego testu i powtarzalność jego interpretacji są wystar- 
czające w danych warunkach; czy charakterystyka danego testu potwierdzi się 
wśród moich pacjentów; czy wyniki testu zmienią leczenie pacjenta; czy wyko- 
nanie testu pomoże mojemu pacjentowi; czy badanie testem określi stopień za- 
awansowania terapii)? 


"| Por. kryteria Dauberta, opisane dalej. 

!2 W analizie, w jakim stopniu stosowane faktycznie metody spełniają te wysokie kryteria, oka- 
zało się (Holmbeck i in., 2008), że w tym obszarze jest ich aż 92% wśród analizowanych metod. 
Jednocześnie niewiele z nich spełnia kryteria wymionione wyżej (diagnostyczna i kliniczna uży- 
teczność). 


16 WŁADYSŁAW JACEK PALUCHOWSKI 


Warto może też wspomnieć o tzw. kryteriach Dauberta (Widacki, 2007; por. 
też Stemplewska-Żakowicz, Paluchowski, 2008). Stosuje się je w Stanach Zjed- 
noczonych do oceny ,,naukowosci” przywoływanego podczas procesu sądowego 
dowodu lub opinii biegłego (także psychologa)”. Chodziło o to, by zapewnić 
oskarżonemu poczucie bezpieczeństwa, że badania będące podstawą opinii (do- 
wodu, ekspertyzy) wykonywane są według jasno określonych i sprawdzonych 
eksperymentalnie kryteriów. Generalnie przyjęto sześć takich kryteriów: falsyfi- 
kacji, recenzji, publikacji, wartości diagnostycznej (poziom błędu), standaryzacji 
i powszechnej akceptacji. Wszystko zaczęło się w roku 1993, gdy przed Sądem 
Najwyższym Stanów Zjednoczonych toczyła się sprawa Daubert vs Merrell Dow 
Pharmaceuticals Inc., w której William Daubert i inni wystąpili przeciwko fir- 
mie farmaceutycznej o odszkodowanie za upośledzenia noworodków, spowodo- 
wane przez zażywanie leku o nazwie Bendectin przez matki w ciąży. Sąd wów- 
czas orzekł, że brak jest naukowych dowodów na związek między zażywaniem 
leku a uszkodzeniem płodu. Kryteria, którymi się kierował, oceniając wiarygod- 
ność opinii biegłych, stały się znane jako „kryteria Dauberta”. Były one później 
uszczegóławiane i rozwijane w sprawach General Electric Co. vs Joiner oraz 
Kumho Tire Co. vs Carmichael. Kryteria Dauberta to w gruncie rzeczy — jak 
piszą William Grove i R. Christopher Barden (1999) — podstawowe zasady na- 
ukowego poznania, sformułowane jako pytania o wskaźniki naukowej rzetelno- 
Sci (tamże, s. 226): 

1. Czy teoria lub technika, stanowiąca podstawę dowodu, jest sprawdzalna? 
Czy da się ją empirycznie weryfikować?” 

2. Czy została ona sprawdzona za pomocą trafnych i rzetelnych procedur 
i czy wynik powtórnych badań był pozytywny? 

3. Czy teoria lub technika, stanowiąca podstawę dowodu, została opisana 
w recenzowanej (peer review) publikacji w literaturze fachowej? Czy była fak- 
tycznie przedmiotem środowiskowej dyskusji naukowej? 

4. Czy znany jest poziom błędów uzyskiwanych przy stosowaniu tej metody? 
Jaki jest błąd pomiaru techniki? Jak często wynik metody jest błędem pierw- 
szego rodzaju (wynik fałszywie pozytywny, polegający na błędnej identyfikacji), 
a jak często drugiego (wynik fałszywie negatywny, polegający na błędnej elimi- 
nacji)? Jak duże jest ryzyko, że przywoływana w opinii teoria jest błędna? 

5. Czy zostały ustanowione standardy dla stosowania danej techniki? 


1 Swoją drogą, to trochę zabawne, że sąd ustala, iż wiedza naukowa to taka, która zdobyto meto- 
dologicznie poprawnym sposobem, oraz jakie są kryteria naukowej (metodologicznej) poprawności. 

'4 Jest to odwołanie sie wprost do krytycznego racjonalizmu Karla Poppera i tzw. kryterium de- 
markacji, czyli odróżniania nauki od pseudonauki. 
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6. Czy dana teoria lub technika jest akceptowana (general acceptance) przez 
odpowiednie środowisko naukowców", więc nie tylko specjalistów, ale także 
przez przedstawicieli ośrodków naukowych zajmujących się daną problematyką? 
Czy jest ona zgodna z aktualnym stanem wiedzy w danej dziedzinie lub ogólniej 
— czy jest zgodna z obecnym stanem nauki? 

Źródeł tego, jak mogłaby wyglądać praktyka testowania, można więc poszu- 
kiwać zarówno w wypracowanych w medycynie postulatach praktyki opartej na 
dowodach empirycznych, jak i na tzw. standardach Dauberta. 


INSTYTUT BUROSA 


Przykładem źródła danych o narzędziach psychologicznych może być dzia- 
łalność Buros Institute of Mental Measurements". Oscar Krisen Buros (1905- 
1978) założył swoiste forum wymiany informacji na temat testów dostępnych na 
rynku (komercyjnych), na którym praktycy i naukowcy mogli publikować 
recenzje dostępnych narzędzi i polemizować ze sobą, a gdzie ich potencjalni 
klienci mogli tych informacji poszukiwać. Przyświecały mu ważne cele: po- 
prawa statusu narzędzi pomiarowych w psychologii oraz poprawa praktyki te- 
stowania. Forum służy interesom nie tylko psychologów praktyków (pozwalając 
dokonać wyboru wiarygodnych narzędzi i stymulując prace badawcze), ale także 
pozwala na kontrolę społeczną. Stworzył on dwie serie publikacji (Mental Me- 
asurements Yearbook i Tests in Print), które stały się źródłem standardów w tym 
zakresie. Po śmierci Burosa jego dzieło kontynuowała żona, Luella Gubrud Bu- 
ros. Archiwa Buros Institute zostały przekazane do Teachers College Hall at the 
University of Nebraska-Lincoln, który teraz zajmuje się publikacjami Instytutu 
(szerzej o działalności BIMM piszą Claiborn, 1991 oraz Plake, Conoley, Kramer, 
Murphy, 1991). 

Oskar K. Buros był z wykształcenia pedagogiem — w roku 1925 ukończył 
studia na University of Minnesota (Educational Administration and Supervision) 


'S Jest to pierwotna wersja standardu oceny wiarygodności dowodu czy opinii — tzw. Frye test 
(lub Frye standard — pochodzącego ze sprawy Frye vs United States z 1923 roku i dotyczącego 
wiarygodności badań poligraficznych). 

'® Testowanie wiele zawdzięcza też Usługom Testów Edukacyjnych (ETS, Educational Testing 
Service). Jest to organizacja non-profit, założona w 1947 roku przez Henry'ego Chaunceya (kie- 
rował ETC do 1970 roku), by przejąć działalność testową od Amerykańskiej Rady Edukacji. Inaczej 
niż w przypadku Buros Institute, jej celem jest nie opiniowanie, lecz tworzenie narzędzi pomiaru 
kompetencji (głównie szkolnych i językowych). Odwołuje się przy tym do standardów Evidence- 
-Centred Design (ECD; Mislevy, Almond, Lukas, 2003). ETS stworzyło popularne testy: SAT, 
TOEIC, TOEFL i GRE®. Jego polska filia nosi nazwę ETS Global Polska. 
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i prowadził w latach 1929-1965 zajęcia z psychometrii i metod statystycznych na 
Rutgers University. Tam też otrzymał tytuł profesora pedagogiki. Stworzony 
przez niego (i dzięki pomocy żony, z początku jedynego pracownika) Institute of 
Mental Measurements pierwotnie koncentrował się na testach edukacyjnych, 
a Buros zamierzał krytycznie analizować nieuzasadnione obietnice składane 
przez autorów testów w celu zwiększenia ich sprzedaży. Jednak w opublikowa- 
nym w 1938 roku pierwszym Mental Measurements Yearbook (MMY) znalazł 
się przegląd ponad 300 testów wykorzystywanych nie tylko w edukacji, a także 
psychologii i biznesie. Kolejno ukazywały się nowe roczniki poświęcone nowym 
testom na rynku — za życia Burosa ukazało się ich osiem, w 2007 roku 
opublikowano The Seventeenth Mental Measurements Yearbook (w latach 1941- 
1985 MMY ukazywał się nieregularnie, od 1989 co dwa lata). Do 1989 roku 
opisano 8779 testów stosowanych w edukacji, psychologii, poradnictwie, do- 
radztwie, prawie i zarządzaniu (Plake i in., 1991, s. 451), a łącznie we wszyst- 
kich MMY znajduje się 10775 opisów testów. Okazjonalnie pojawiały się też 
publikacje poświęcone testom w danym obszarze, jak na przykład Personality 
Tests and Reviews, Science Tests and Reviews, Social Studies Tests and Reviews, 
Vocational Tests and Reviews lub Reading Tests and Reviews. Typowa pozycja 
w MMY zawiera przegląd testu komercyjnego adresowanego do angielskoję- 
zycznych użytkowników i obejmuje opis testu (nazwa, cel, grupa odniesienia, 
data publikacji, sposób badania, czas badania, autor i wydawca, krótkie omówie- 
nie, historia testu, szczegóły techniczne), jedną lub dwie krótkie recenzje (1000- 
-1500 słów) oraz wskazówki literaturowe i bibliografię (por. EFPA/Bartram, 
Lindley, Kennedy, 2008). Od lat siedemdziesiątych autorzy lub wydawcy testu 
muszą dostarczyć jego pełną dokumentację dotyczącą własności psychometrycz- 
nych, by sprawdzić, czy spełniają podstawowe wymagania w tym zakresie. 
Recenzenci dobierani są ze względu na tematykę (obszar, grupę docelową) testu 
oraz doświadczenie w jego stosowaniu, stopień doktora odpowiednio do obszaru 
testu i znajomość psychometrii. Recenzenci głównie odwołują się do „Standar- 
dów dla testów stosowanych w psychologii i pedagogice” (APA 2007), a ich ce- 
lem jest nie tylko diagnoza stanu rzeczy i jego krytyka, ale także proponowanie 
kierunku zmian. Recenzowanie jest bezpłatne. Płaci się za opracowania MMY 
w wersji papierowej lub za korzystanie z recenzji za pośrednictwem Internetu. 

W roku 1961 pojawiła się nowa publikacja, uzupełniająca MMY — Tests in 
Print (TIP); dotychczas ukazało się siedem tomów. Jak wskazuje pełna nazwa tej 
pozycji (Tests in Print: An Index to Tests, Test Reviews, and the Literature on 
Specific Tests), jest to wyczerpujący spis aktualnie dostępnych komercyjnych 
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testów, zawierający podstawowe o nich informacje (opis testu) oraz bibliografię 
recenzji o testach zamieszczonych w publikacjach MMY. 

W 1994 roku, dzięki wsparciu żony Burosa, powstało Centrum Testowania 
(Oscar and Luella Buros Center for Testing), obejmujące swym działaniem dwa 
obszary ważne dla testów: kontynuujący swoją pracę Instytut (Buros Institute of 
Mental Measurements — BIMM), oferujący także publikacje elektroniczne (w tym 
Test Reviews Online, zawierający informacje na temat testów publikowane w MMY 
od 1985 roku), oraz Buros Institute for Assessment Consultation and Outreach 
(BIACO), zajmujący się nie tylko testami spoza poprzednich obszarów zainte- 
resowania, ale szerzej rozumianymi procedurami ewaluacji w nauczaniu i wszel- 
kiego rodzaju certyfikacji i prowadzący na wniosek wydawcy (test provider) 
audyt ich zgodności z Standards for Proprietary Testing Programs. 


JAK BYWA I CO MOŻNA ZROBIĆ, 
BY BYŁO LEPIEJ? 


Obserwuje się różne naganne zjawiska związane z upowszechnianiem testów 
i dotyczące głównie łamania zasad etyki zawodowej: publikowanie zadań testo- 
wych”, przykładów rozwiązań lub testów z kluczem *, szkolenia w rozwiązywa- 
niu testów selekcyjnych’” itp. Innym nagannym zjawiskiem jest nie tylko 
kopiowanie metod zamiast ich kupowania, ale także wykorzystywanie bez zgody 
autora testu z publikacji naukowej do celów komercyjnych lub naukowych czy 
nawet wykorzystywanie fragmentów (zadań, pytań). Nie wystarczy ustawa 
o zawodzie psychologa, kodeks (PTP, 2000) czy standardy (AERA, APA, 
NCME, 2007”), by wyeliminować z rynku tego rodzaju patologie. Nie pomoże 
w tym i „polski Buros”. 


17 Ciekawa jest sprawa techniki Rorschacha — oficjalnie od 1992 roku plansze testowe nie pod- 
legają już ochronie (po 70 latach od śmierci twórcy utwory stają się własnością publiczną). Zostały 
one w związku z tym opublikowane m.in. w Wikipedii, co spowodowało protesty Amerykańskiego 
Stowarzyszenia Psychologicznego oraz Brytyjskiego Towarzystwa Psychologicznego, które twier- 
dzą, że udostępnienie testu jest nieetyczne (Cohen, 2009). 

18 Tu niesławnym przykładem może być czasopismo Forum Psychologiczne, wydawane przez 
Europejską Akademię Psychologii Integracyjnej Sp. z 0.0. w Łodzi. 

19 Jak pisze jeden z użytkowników Internetu: „Nawet psychologowie ogłaszają się w sieci 
z propozycją przygotowania kandydata «pod test»: 4 wizyty — 600 zł”. W kontekście przestrzegania 
praw autorskich zabawna jest notka zamieszczona w Internecie przez autora zestawu rozwiązań do 
testu psychologicznego do policji, który powołuje się na prawo autorskie do nich i zabrania innym 
jego sprzedawania! 

20 W których zalecenia w tych sprawach są jasno sformułowane — por. AERA, APA, NCME, 
2007, s. 193-205 czy s. 126-132. 
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Istnieją Wytyczne Międzynarodowej Komisji ds. Testów (International Test 
Commission — ITC) dotyczące stosowania testów, w tłumaczeniu Teresy Szu- 
strowej (PTP, 2000; por. ITC, 2000), zamieszczone na stronie Pracowni Testów 
Psychologicznych. Opisuje się tam postępowanie zgodne z zasadami dobrej 
praktyki: w tym, jak oceniać potencjalną użyteczność badania testowego w danej 
sytuacji diagnostycznej i jak je adekwatnie do celu badania dobierać, na co 
zwracać uwagę oceniając technicznie parametry jakości testu, oraz jak spraw- 
dzać przydatność testu w sytuacji zmian społecznego kontekstu ich stosowania. 
Także Europejska Federacja Towarzystw Psychologicznych (The European Fe- 
deration of Psychologists Association — EFPA) powołała komisję do opracowa- 
nia standardów stosowania testów w obszarze psychologii pracy i organizacji 
(EFPA, EAWOP 2005). Być może zawarte tam postulaty powinny również być 
poddane dyskusji i być może powinna powstać analogiczna komisja koordynu- 
jąca ustalenia z polskim porządkiem prawnym i propagująca je w Polsce. Pod jej 
patronatem opracowano także standardy opisu testów (EFPA/Bartram, Lindley, 
Kennedy, 2008). Wytyczne nie zastąpią jednak informacji. 

Psychologowie swoimi decyzjami wpływają na wiele dziedzin życia: 
oświatę, wymiar sprawiedliwości (zarówno w sprawach karnych, jak i cywil- 
nych, w tym sprawach dotyczących nieletnich, władzy rodzicielskiej lub prawa 
opieki nad dzieckiem, zdolności do zawarcia małżeństwa itd.), zdrowie i opiekę 
społeczną, różne służby medycyny pracy, służby mundurowe itp. (por. Szustro- 
wa, 2003). I tak jak orzekanie w sprawach ściślej regulowanych przez przepisy 
(takich jak wydawanie zezwoleń różnego rodzaju, badania kierowców”! itp.) 
raczej nie spotyka się z negatywnym odbiorem społecznym, to psychologiczne 
opinie i ekspertyzy sądowe (Stanik, Majchrzyk 1995) bywają efektem zarówno 
niewiedzy, jak i stereotypizacji oraz podlegania emocjonalnym przesądom 
(Stemplewska-Żakowicz, Paluchowski, 2008, s. 72; Słysz, 2008, s. 52-55), co 
powoduje, że są częstym tematem złych opinii w Internecie (np. opisuje się, że 
w orzeczeniach co do ograniczenia władzy rodzicielskiej w RODK badania 
bazowały na „skróconej wersji MMPI”, i na tej podstawie psycholog orzekał, 


21 I tu jednak zdarzają się przepisy, które stwarzają dogodne okoliczności do obniżania standar- 
dów profesjonalnych — np. w uchylonym w 1999 r. Zarządzeniu Ministra Transportu i Gospodarki 
Morskiej z dnia 12 stycznia 1995 r. w sprawie kierowania osób ubiegających się o uprawnienia do 
kierowania pojazdami (MP 1995 nr 3 poz. 41) zalecano, że „w przypadku uzyskania przez osobę 
badaną w skali introwersji-ekstrawersji, stabilności emocjonalnej-neurotyczności wyniku poza 
obszarem normy psychometrycznej, psycholog stosuje test MMPI-WISKAD”, a więc odsyłano do 
narzędzia nie mającego debitu w Polsce oraz ewidentnie nieaktualnego. 

22 Jak pisze się o jednym z takich przypadków: „Biegli stwierdzili, że zastosowali wersję skró- 
coną, opracowaną przez psychologa z Poznania. [...] Skontaktowałam się więc z Pracownią Testów 
Psychologicznych Polskiego Towarzystwa Psychologicznego. Potwierdziły się moje przypuszczenia 
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„kto daje większe gwarancje prawidłowego wychowywania dziecka”, lub że 
badano iloraz inteligencji za pomocą testu Rorschacha lub „wybranymi pod- 
testami Wechslera”, uzasadniając to faktem, iż „zastosowano eksperyment kli- 
niczny”, albo w przypadku podejrzenia molestowania badano dziecko testem 
Drzewa, Zwierzyniec i CAT”). Tu więc problem leży — w braku wiedzy opartej 
na poprawnie metodologicznie przeprowadzonych i aktualnych badaniach 
naukowych, a nie na lekceważeniu standardów etycznych zawodu. 

Od ponad 20 lat mamy do czynienia z komercyjnym rynkiem metod psy- 
chologicznych (diagnostycznych), a głównym wydawcą testów jest spółka Pra- 
cownia Testów Psychologicznych, której jedynym właścicielem jest Polskie 
Towarzystwo Psychologiczne”. Możliwość zakupu pewnej grupy testów psy- 
chologicznych mają tam wyłącznie osoby legitymujące się dyplomem ukończe- 
nia magisterskich studiów psychologicznych”, inne przeznaczone są dla innych 
profesjonalistów (bez jednoznacznego zdefiniowania tej grupy na stronie inter- 
netowej Pracowni), a niektóre dostępne są dla wszystkich chętnych (por. też 
Jaworowska, 2000). Studenci, którzy chcą w swojej pracy magisterskiej prowa- 
dzić badania za pomocą testów, mogą je kupić, ale pod warunkiem przedstawie- 
nia upoważnienia swojego promotora, który musi być psychologiem. Odpowie- 
dzialne stosowanie to przede wszystkim kwestia osoby z niej korzystającej, 
a brak wiedzy i świadomości konsekwencji opartych na ich wynikach decyzji 
jest groźny. Za to, co dzieje się po nabyciu testu, odpowiadają więc psycholo- 
gowie. Niepsycholog stosujący (w sposób nieuprawniony) testy nie jest do ni- 
czego zobligowany, a psycholog — jest ograniczony przez kodeks etyczno-za- 
wodowy (PTP, 2000) i standardy (AERA, APA, NCME, 2007). Jest też w Polsce 
jeszcze kilka innych firm, zajmujących się sprzedażą testów lub całych procedur 
diagnostycznych. Wykorzystuje się także wiele testów znanych z innych krajów 


— niezależnie od wersji (skrócona czy długa) testu tego NIE MOŻNA stosować w Polsce, bo nikt 
w Polsce nie ma praw autorskich do niego. A [...] inni «psychologowie» go stosują”. 

23 Jak pisze internauta: „Sądy skazują mężczyzn za molestowanie dzieci na podstawie agresyw- 
nej kreski i pokolorowanej na czerwono spódniczki” (por. też Stemplewska-Żakowicz, Paluchow- 
ski, 2008, s. 51). 

24 Jej historia przedstawiona jest krótko na stronie http://www.practest.com.pl/html/o-nas 
(23.11.2009). 

23 Czemu towarzyszą (niesprawiedliwe) wypowiedzi, takie jak na jednym z forów: „[...] ustawa 
o zawodzie psychologa zabrania niepsychologom używania w Polsce testów psychologicznych, 
wyłącza konstytucyjne prawo do prowadzenia badań nad testami psychologicznymi i ogólnie zakła- 
da, że najlepiej, jakby pozostawały tajne, to nie będzie trzeba wkładać wysiłku w ich ewaluację, 
a ciemnogród pozostanie ciemnogrodem ;-)”. Z drugiej strony w Internecie są i takie głosy: ,,[...] bez 
podyplomowej specjalizacji i praktyki zawodowej nie będziesz ich [testów] umiała prawidłowo 
zinterpretować. Jeżeli masz co do tego jakieś wątpliwości, to przeczytaj kilka podręczników neuro- 
logii i spróbuj zinterpretować parę wykresów EEG :))”. 
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(głównie Stanów Zjednoczonych), które nie mają opublikowanych badań ich 
własności psychometrycznych i które w związku z tym powinny być nazywane 
psychozabawą lub testem pseudopsychologicznym (choć często reklamowane 
i sprzedawane są pod nazwą „testy psychometryczne”)". Zdarza się też, że 
upowszechniane są i wykorzystywane (nawet w opiniach sądowych) testy bez 
odpowiedniego debitu, czyli prawa do rozpowszechniania ich na terenie Polski 
(a więc zgody autora czy oryginalnego wydawcy). 

Aczkolwiek deklarowanym przedmiotem działalności Pracowni Testów Psy- 
chologicznych jest „szerzenie etycznych i profesjonalnych standardów diagnozy 
opartej na narzędziach psychometrycznych”, to jednak wydawca testów nie 
może być w ich sprawie bezstronnym opiniodawcą. Trudno też pogodzić postulat 
wolnego rynku z kontrolą nad wydawaniem testów. Ponadto inicjowanie badań 
naukowych nad testami nie jest zasadniczym celem firmy komercyjnej. Czym 
innym jest także propagowanie standardów (co często bywa deklarowanym ce- 
lem korporacji zawodowych), a czym innym dostarczanie informacji (recenzji, 
publikacji) na temat konkretnych technik diagnostycznych. Czego więc można 
oczekiwać, by praktyka testowania w Polsce uległa poprawie? 

Kształcenie w czasie jednolitych magisterskich studiów psychologicznych 
nie ma charakteru zawodowego, więc nie dostarcza kompetencji wystarczających 
do prawidłowego interpretowania wyników testów psychologicznych”. Ukoń- 
czenie psychologii (a nawet specjalności klinicznej) nie pociąga za sobą ani 
późniejszej pracy w zawodzie psychologa, ani — tym bardziej — bycia w przy- 
szłości psychodiagnostą i/lub psychoterapeutą. Podobnie jak w opisywanym 
przypadku medycyny opartej na dowodach empirycznych tak i w psychologii 
(dokładniej: psychodiagnostyce) jest prawdą, że często nabywana podczas stu- 
diów wiedza szybko się dezaktualizuje, natomiast nie poddane refleksji doświad- 
czenie zawodowe zamienia je w zmitologizowaną wiedzę (por. np. badania Kim 


°° W ich opisach spotkać można takie sformułowania, jak: „Wyniki nie różnicują osób bada- 
nych ze względu na płeć lub pochodzenie etniczne” (co usprawiedliwia brak polskich norm), że 
procedura diagnostyczna jest ,,[...] przekazywana do firmy w formie swoistego know-how, którym 
przedsiębiorstwo samo dysponuje po odbytych warsztatach certyfikujących. Jest to bardzo wygodna 
forma współpracy, ponieważ nikt nie narzuca gotowych rozwiązań i każdy użytkownik decyzje 
podejmuje sam” (co uzasadnia brak nadzoru i usprawiedliwia brak kompetencji osób posługujących 
się daną procedurą), czy że test „przekłada język psychologii [...] na język kolorów, symbolizują- 
cych określony zespół kompetencji psychologicznych” (co ma uzasadniać jego wyższość nad narzę- 
dziami „akademickimi '). 

21 Trzeba odróżnić kompetencje w zakresie przeprowadzania badania testowego (zwanej 
z angielska administracją; najczęściej dość dokładnie opisanego w instrukcji do testu dla osoby 
badającej) od kompetencji potrzebnych do interpretowania (rozumienia znaczeń) wyników testu 
w danym obszarze i wydawania na tej podstawie opinii (orzeczeń). 
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i Ahn: Stemplewska-Żakowicz, Paluchowski, 2008, s. 72). Być może zbieranie 
doświadczeń w zakresie diagnozowania powinno być podobnie nadzorowane 
(podlegać superwizji), jak w zakresie terapii; powinna też towarzyszyć temu 
analogiczna oferta studiów podyplomowych (kursów certyfikujących). Z dezak- 
tualizacji wiedzy diagnostycznej wynika postulat konieczności ciągłego jej uzu- 
pełniania. Oczywistym źródłem takiej wiedzy mogłyby być naukowe doniesienia 
z badań nad istniejącymi na rynku komercyjnymi procedurami diagnostycznymi, 
publikowane w odpowiednich działach w istniejących czasopismach”*. Jedno- 
cześnie psychologowie praktycy nie otrzymują danych do podejmowania decyzji 
o wyborze testu, gdyż publikacji takich ewidentnie brakuje. 

Zgodzić się należy, że praktycy nie są w stanie ocenić i dokonać syntezy pu- 
blikowanych danych i że potrzebne są w tym względzie bazy danych na temat 
metod wraz z syntetycznym omówieniem wyników badań — coś na kształt publi- 
kowanych przez Instytut Burosa MMY. Wzorem opisanych wyżej rozwiązań 
warto rozważyć powołanie organizacji, zajmującej się publikowaniem bibliogra- 
fii prac naukowych na temat testów oraz recenzji narzędzi dostępnych na rynku 
(komercyjnych) i gdzie potencjalni klienci mogliby poszukiwać informacji. Pu- 
blikacja taka zawierać by mogła zarówno informacje formalno-psychometryczne 
— ogólnodostępne, jak i szczegółowe opinie psychometryczne oraz merytoryczne 
— dostępne tylko dla psychologów czy innych uprawnionych osób. Pozwalałaby 
ona na ugruntowane na wynikach badań empirycznych wybory narzędzi oraz 
zdynamizowałaby prace badawcze nad nimi. Jednym z celów takiej organizacji 
mogłoby też być propagowanie powstawania prac akademickich (w tym magi- 
sterskich) na temat testów komercyjnych. Wzorem Buros Institute of Mental 
Measurements (BIMM) recenzje byłyby efektem działalności non profit recen- 
zentów, a zawartość „polskiego Burosa” — skutkiem współpracy wydawców te- 
stów, wyższych uczelni prowadzących studia psychologiczne oraz psychologów 
praktyków. 
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EVIDENCE-BASED ASSESSMENT 
— DO WE NEED “POLISH BUROS”? 


Summary 


The aim of this paper is to describe the practice in psychological assessment and diagnosis in Po- 
land. This article focuses on two key themes in the on evidence-based assessment. The first one is 
application of EBM in psychology. The second is activity and achievement of the Buros Institute of 
Mental Measurements. The implications of these themes for the future of psychological assessment 
practice are discussed. 


Key words: evidence-based assessment — do we need “polish Buros”?, assessment, EBA, EBM. 


